home *** CD-ROM | disk | FTP | other *** search
/ Amiga Plus Special 26 / AMIGAplus Sonderheft 26 (2000)(Falke)(DE)(Track 1 of 2)[!].iso / Tools / Text-Viewer / MSWordView / CHANGELOG < prev    next >
Text File  |  1999-03-29  |  46KB  |  834 lines

  1. Changes up to 0.5.2
  2.     * implemented auto text color colour check for table cells, no more
  3.       black on black, or black on blue. i must look closely at what other
  4.       auto changes word makes.
  5.     * some uber-simple greyscaling code when table look says no-color.
  6.     * verified it works under AIX, made a few changes that showed up due
  7.     to its stricter malloc, theres probably a few more malloc related
  8.     issues hiding in there.
  9.     * column breaks show up as well now.
  10.     * the various types of section breaks are distinguisable from the
  11.     others, and from page breaks.
  12.     * a few changes to make sure formatting and tables get on better 
  13.     together.
  14.     * sequence field supported, i.e caption numbering, i just use the last
  15.     fields that msword left in there.
  16.     * changed hyperlinking so that it works with bookmarks that are in
  17.     comments (annotations).
  18.     * i now support multiple bookmarks that end on the same location.
  19.     * multiple bookmarks that start on the same location should be supported,
  20.     but no examples yet.
  21.     * the comment author initials are extracted and used in the main document
  22.     when referencing comments.
  23.     * comments now end when they are supposed to, only the correct comments get
  24.     included, should work for fastsave, not tested.
  25.     * removed unused variables, sorted out a few other warnings, maybe itll
  26.     squeak by the irix compiler now ?
  27.     * names and initial info for comments is extracted as well, and stuck in a 
  28.     table at the end of the document.
  29.     * fixed the <a name= for comments, should work in fast saved.
  30.     * custom graphics for annotations.
  31. ALL TODO
  32.     * whats the story with the page number ref that shows up in annotations ?
  33.     * the bounds of the comment in the main document ?
  34.     * strikethrough and annotations ?
  35.     * start using the same structure names as word, and putting stuff like
  36.     get_FIB in order, switch to using bit fields where word uses them
  37.     rather than the current promotion to U8 that i do to keep my sanity.
  38.     * allow the various colors that im using to specifiy different attributes to
  39.     be modified by the user.
  40.     * bookmarks embedded in html tags break them, constructs such as e.g
  41.     <A href="stuff">stuf<a name="here">f</a></A> are being output even though
  42.     thats well wrong in html.
  43.     * optional html correct handling of lists.
  44.     * hmm, with bookmarks implemented, it might not be too hard to do 
  45.     the toc
  46.     * place all wingding and symbolfont names directly in the makefile for
  47.     make install.
  48.     * convert the cross-referenced "above/below", into hyperlinked above and 
  49.     below.
  50.     * support ole embedded graphics ?
  51.     * optional support for specifying special fonts, not recommended for use
  52.     on publishing for internet sites, but useful for internal use for those 
  53.     of you who have done the funky chicken dance with unix netscape to work 
  54.     with ms winding etc fonts or are using ie/netscape on windows.
  55.     * all the fields, document background colour, wmf converter .
  56.     * it might be possible to support right indentation, if its simultaneous
  57.     with equal left indentation by using <blockquote> instead of <dir>, but
  58.     i dont see that as essential.
  59.     * inside/outside page numbering doesnt work, dont know where its set.
  60.     * find the location of whatever sets the footnote & endnote styles of 
  61.     numbering, as its currently unknown, i havent figured it out yet, this
  62.     isnt super essential though, but it is annoying.
  63.     * all endnotes are listed at the end of the section rather than optionally
  64.     at the end of the document, i dont know how this is done, doesnt appear 
  65.     documented.
  66.     * two pass parser for finding best fit html tables for word tables.
  67.     * you know i could really do with a nifty logo.
  68.     * gtk+dps wysiwyg viewer, output to ps from this
  69.     * --> xml support ??, im told that xml is the way to go, i dont know a thing
  70.     about it yet, so the next task is to learn it.
  71.     * use incremental zlib functions to do decompressing rather than use mmap.
  72.     * make sure annotations references always get shown in the normal font ?
  73.     * hyperlink sequence fields ?
  74.     * doesnt compile under neXt ?
  75.     * do a check for mman.h and dont do compression if not there.
  76. Changes up to 0.5.1
  77.     * forgot to change the version no in the source.
  78.     * damn sunsite broke connection half way through uploading.
  79. Changes up to 0.5.0
  80.     * Martin Kalms <kalms@lysator.liu.se>, configure fix for sunos 4.1 in
  81.     relation to strerror.
  82.     * added option where you can ignore table widths.
  83.     * custom graphics for comments.
  84.     * endnote autonumbering now works, now defaults in roman numerals.
  85.     * fast save footnote problem fixed, though i think things might be
  86.     even more complex that i thought, so keep an eye on that area.
  87.     * footnotes are in a colour of their own.
  88.     * symbols as footnotes, required a change to the 4a30 sprm that might fix
  89.     a few other char formatting issues.
  90.     * restarting footnotes on each page, and each section works, this is 
  91.     encoded in the the number itself it appears, a href and a name, and some 
  92.     invalid html code fixed in the footnote area as well, footnotes are now in 
  93.     a colour of their own *but* the location of whatever sets the footnote & 
  94.     endnote styles of numbering is unknown, i havent figured it out.
  95.     * all endnotes are listed at the end of the section rather than optionally
  96.     at the end of the document, i dont know how this is done, doesnt appear 
  97.     documented.
  98.     * textmarks / bookmarks and explicit hyperlinking supported, bugs in 
  99.     old code removed hopefully and internal hyperlinks put in via insert
  100.     hyperlink are supported.
  101.     * support for bookmarks, i.e they are converted to <a name>[text]</a> html 
  102.     code.
  103.     * converted cross-referenced textmarks/bookmarks into hyperlinks.
  104.     * wmf files can now be decompressed thanks to peter.brandstrom@ericsson.com
  105.     now i need a wmf --> something useful converter. i see that theres a new
  106.     one available off the gimp plugin page, with some uberhacking it might
  107.     do the trick, the notes/wmf dir has a goodly chunk of info on the format if
  108.     anyone wants to do it for me.
  109.     * when bookmarks are embedded in bookmarks something odd appears to occur, 
  110.     but nonetheless the ms save as html does the same, so im assuming that its 
  111.     ok
  112.     * added bookmark support to fastsaved, should work fine, not tested.
  113.     * pagebreak gifs are correctly centered if the next para is a centered etc 
  114.     one.
  115.     * author field supported.
  116.     * proper positioning of page numbers, general layout of headers appears
  117.     to be fine, except that tab stops are used in headers to center, left
  118.     and right align headers, which doesnt work so well in html mode.
  119.     * added defensive code to some sort of list bug.
  120.     * mimic strike-through and double st by setting the text color to either
  121.     #ed32ff or #ff7332
  122.     * disallow height commands inside tables, as the model of paragraph heights
  123.     doesnt fit well with the architecture for tables, so im ignoring them in
  124.     tables, hopefully noone will notice :-)
  125.     * fixed a small bug in sprm which was causing errors later in lists.
  126.     * tables and paragraph formatting were misaligned across td boundries.
  127.     so now i clear specials and fonts on entry to a table, and on exit of each
  128.     cell, hopefully i broke nothing else on doing so.
  129.     * at least one really bad conversion with a file called RESUME.doc, but in
  130.     my defence i looked at the msword conversion of this to html, and its just
  131.     as buggered up so rasp ;-P
  132.     * added credits file
  133.     * found problem in decompress code, i didnt make it good enough for real
  134.     world usage, i now use mmapping so make my life easier, dont know if this
  135.     is fully portable, works on linux and solaris.
  136.     * oledecod had bugs on cleanup, so sent filters group wmf.doc and 
  137.     Contribu.doc to demo the problems.
  138.     * i now use oledecod 0.0.4 which fixes cleanup problems, but Contribu.doc
  139.     style problems continue, they return 5 but laola can extract the streams
  140.     nonetheless while oledecode cannot, i modified the original laolareplace.c
  141.     to handle this as well.
  142.     * oledecod 0.0.4 has a bug in relation to 1812bb.doc, laolareplace.old.c
  143.     hasnt this bug, so im back to using that again.
  144.     * those ffffffff's in lists that haunted me in earlier releases are *back*
  145.     grrrrr!!, anyway ive another massive nasty workaround that im using that
  146.     hasnt crashed any docs, and appears to do the right thing, at least in
  147.     propos~s.doc
  148.     * wmf decompression code changed to use mmap, replaces the original code
  149.     that ate memory, if mmapping doesnt work try looking at the zlib docs
  150.     and change the code to fixed buffer incremental decompression.
  151.     * added a bailout to ignore encrypted documents, wonder how id decrypt
  152.     them if i had the correct password, anyone know ?
  153.     * added a bug fix for crossreference parsing.
  154.     * beginnings of tables of contents included, doesnt always work yet.
  155.     * bug where if the word file ends on a table, the table wasnt closed off is
  156.     fixed.
  157.     * bug where non built in graphic types were causing hangs.
  158.     * im now often happily (if slowly) converting 90 and 100 page documents,
  159.     the only thing i really am unhappy with is table handling, which is
  160.     also one of the reasons the conversion is *soooo* slow sometimes, the
  161.     other reason is those godforsaken fastsaved files.
  162.     * fixed some other mem related bugs, converted sucessfully the last two 
  163.     problem docs without crashes.
  164.     * table looks are somewhat supported, though theres no support for last
  165.     row and last column different from the rest of the cells as of yet, this
  166.     will have to wait until multi pass on tables is implemented.
  167.     * the foregrounds and character attributes in general for tables appear
  168.     to always set correctly in general, but i believe i have to look into
  169.     how the "auto" text color selects is final colour, as ive been assuming
  170.     that it gets set to black, which is a fairly valid assumption most
  171.     of the time, but not always, so a few docs will have black text on
  172.     black backgrounds in table cells, but the situation is much improved.
  173.     * ran purify over mswordview, removed a load of dodgy code out of it, theres
  174.     still a bug or two hiding in the list code, which i belive is the reason
  175.     that lists are sometimes missing in complex documents, e.g meeting.doc
  176.     i think i love purify, its the bees knees.
  177.     * dib's are now extracted as well, though i dont do anything with them yet,
  178.     this fixes yet more crashes.
  179.     * fixed laolareplace.old.c, which is the version im going to use for this
  180.     release, to work on 64bit platforms, a few longs had crept into the code
  181.     there which shagged the whole thing up. I havent done extensive tests on
  182.     64bit yet, but im confident that itll work.
  183.     * fixed defines to make it work if theres no zlib present.
  184.     * no crashes after running mswordview on 300 megs of uploaded files.
  185.     * good enough to upload to sunsite, version number reflects this.
  186. changes up to 0.4.9
  187.     --This is an interim release while im in scotland until later this november--
  188.     added features are that the gateway is included, endnotes are supported,
  189.     pagebreaks that split tables are supported and some more bugs are fixed,
  190.     especially in relation to graphics.
  191.     * added -o - option to gateway, like i should have about 4 releases
  192.     ago.
  193.     * fixed graphics again, forgot to reset the extra amount that some have
  194.     before the graphic data begins, means more jpgs and pngs should work.
  195.     * endnote text done in simple saved
  196.     * cleaned up beginning whitespace from footnotes/endnotes/comments.
  197.     * endnotes in complex mode is in, needs testing.
  198.     * changed url code to match the other field code, fixes a big bug there.
  199.     * header and footer colours were wrong again, fixed.
  200.     * indent drift is fixed again, moved do_indent into decode_?_specials
  201.     * pagebreaks can occur in the middle of a table, this sort of confusion
  202.     is fixed for full saved files, and is probably fixed for fastsaved files
  203.     * pagebreaks now look like they occur after footers,footnotes and endnotes.
  204.     * custom graphics replace <hr>'s as there were too many of them at the
  205.     bottom of a page to figure out what was what.
  206.     * custom graphics for footnotes, and comments
  207. changes up to 0.4.8
  208.     * this has a slew of bug fixes related to graphics and a new option
  209.     to put images in a certain directory
  210.     * fixed f006 code in blip handling, removing a slew of hangs.
  211.     * ignore every graphic that isnt an understood type, removes hangs.
  212.     * figured out when theres an extra 16 bytes to delete from the beginning
  213.     of a blit, and where one of my magical 17s were coming from
  214.     * got a bug fix off Harry Shamansky (shamansky@adinc.com) as to why
  215.     the default make wouldnt work under irix.
  216.     * the current spid handling was mismatching spids and the graphics
  217.     involved.
  218.     * i cant handle forms, or ole data, so ive added a check to avoid
  219.     doing them, removes crashes.
  220.     * also ive added some other code to watch out for unsupported graphic
  221.     features.
  222.     * msword can include wmf and emf files, these are stored in compressed
  223.     form, using lz encoding in a fashion supposedly compatable with the zlib 
  224.     library, but i havent been able to decompress them yet and even if i 
  225.     could i dont know of any source to convert wmf/emf files to anything 
  226.     usable under linux
  227.     * ive changed blip handling, so that it works better, well i believe its
  228.     more crash resitant, but im still not 100% happy with 0x01 handling.
  229.     * if you insert a bmp via insert->picture->from file, it appears to
  230.     be converted to png for you, handy.
  231.     * paragraph indentation is back in, lists and table were confusing the
  232.     indentation code.
  233.     * fixed titchy bug so that space at beginning of lists isnt underlined.
  234.     * support paragraphs whose first lines indentation is greater that the rest
  235.     of it
  236.     * support vertical space between paragraphs.
  237.     * sorted out end_para for the first paragraph found in complex mode, i think
  238.     i have it right now, in passing i reckon a load of those pap searches
  239.     in complex mode are unneeded, but i dont want to rock a working boat, if it
  240.     aint broke dont fix it as an uncle of mine used say, though we did seem to
  241.     spend an awful amount of time panically fixing things that broke 
  242.     dramaticlly after years of neglect.
  243.     * finally settled on dirs for left indentation, blockquotes indent from both 
  244.     sides automatically
  245.     * added an option to put graphics in a specified dir.
  246.     * added an option to find the graphics at a specified url.
  247.     * updated man page.
  248.     * made another change to blip handling, fixes some problems.
  249. changes up to 0.4.7
  250.     * warning !, in this release mswordview no longer outputs by default to
  251.     the screen. use -o - for this behaviour. This is an interim release to
  252.     reassure people that im still working on it, its got quite a few new
  253.     features and bug fixes since 0.4.4 read down for them all.
  254.     * implemented tabbing with trans gif, optionally use hardspaces or 
  255.     dont do it at all.
  256.     * added some support for borders such that the vertical space between 
  257.     paragraphs due to width of borders is retained through the use of 
  258.     vertical trans gif space.
  259. changes up to 0.4.6
  260.     * indentation of paragraphs dithered to <blockquote>'s is out again as it 
  261.     its doing strange things on long complicated documents.
  262.     * table cell shading done, fully supported i believe.
  263.     * drew all the available table patterns in all available colors, 
  264.     made small transparent gifs out of them, if someone wants to do 
  265.     better copies of the ms ones go ahead, use the convert.sh script
  266.     in the patterns dir to generate pics in all necessary colors.
  267.     * text color support is in
  268.     * word underline, which iswhere whitespace isnt underlined is supported.
  269.     * courier as an alternative to courier new, times alternative to
  270.     times new roman font face, helvetica as an alternative for everything 
  271.     else.
  272.     * all caps supported, Small caps supported, though i want full tests
  273.     of those two babies in all modes. Similiar to the fontfaces these two 
  274.     babies are only supported in ascii languages, as i dont really know how 
  275.     to convert utf-8 unicode into upper case !
  276.     * text animations supported by converting them to blink :-)
  277.     features-examples dir added, supported-font-features.doc has what i
  278.     believe is all the font features that word supports demonstrated in it.
  279.     id be happy to have omissions noted, mswordview now supports
  280.     1) font size
  281.     2) colored text, (in headers and footers as well)
  282.     3) font face in ascii based languages
  283.     4) underline, including word underline, where whitespace is nt underlined
  284.     5) super and sub script
  285.     6) All caps and small caps (ascii based languages only)
  286.     7) text animations dithered to blink tag
  287.     mswordview doesnt support due to html limitations (at least i dont think
  288.     i can do them)
  289.     strikethrough,double strikethrough,shadowed and outlined text, embossed
  290.     or engraved text. 
  291.     "hidden text" is shown, coz i dont know the purpose of it yet
  292.     all caps, small caps and font face for non ascii languages.
  293.     character spacing
  294.     * centralized pap initialization code
  295.     * fixed a crash causing blip bug
  296.     * fixed a crash due to sep sprms showing up in a papx !!, i ignored them
  297.     im sure that will bite me hard in the future, but ive documented it here so
  298.     i wont forget.
  299.     - Problem:
  300.         now we have a problem with paragraph properties which is only making
  301.     a difference now that i want to use the paragraph justification codes.
  302.     there exist pieces which have fc's greater than the maximum one listed
  303.     in the plcfbtePapx !, ive been pushing them around for the last 2 days to
  304.     no avail, im beginning to think that maybe this means that they have no
  305.     native formatting of their own, the catch is to find the paragaph that they
  306.     belong to, the spec says to find that by taking the smallest fc in fkp
  307.     tables that is bigger than the current fc, but there *is none* thats bigger.
  308.     my thought is to remember if this piece is the beginning of a paragraph
  309.     mark and if not inherit the previous piece's formatting, and keep going
  310.     backward until we get one. If it is then either im supposed to default to
  311.     a new one or go forward to find one.
  312.     +  Solution: Ah-ha i believe i have it, 
  313.         + firstly varient 1 gpprls have to be supported, and i had some offsetting 
  314.         in them wrong
  315.         + secondly i had a very subtle bug where i changed the value of the avalrgfc,
  316.         from when i didnt know why sometimes they were +400000000, of course i now
  317.         use it to determine if the end of the piece if twice the distance of its 
  318.         reported character len of not, and with the val reset i ocassionally had
  319.         the piece recorded as being too long, so the paragraph properties of the 
  320.         wrong paragraph were being used.
  321.     * added is paragraph formatting information, supported well is
  322.         1) centering,        center
  323.         2) right justification , div align=right
  324.     * made a closing paragraph thing like the closing chp for the blurb at the
  325.     bottom to avoid having the version info centered of justified.
  326.     * 0x01 fSpec graphics are now supported in addition to 0x08 graphics 
  327.       while both of these are draw objects, only non-vector graphics are supported, and 
  328.       only partial support of those i.e png and jpg.
  329.       as with the 0x08 graphics theres a lot of magic emperically derived offsets being used
  330.       to put it together, so dont be too surprised at getting corrupt images.
  331.       though i *have* fixed a bug in png handling i believe for 0x08 graphic which was the
  332.       previous subset i supported.
  333. changes up to 0.4.5
  334.     * i now open graphic and doc files in binary mode to support platforms where this
  335.     makes a difference.
  336.     * replaced laola, perl no longer required, thanks to the mighty
  337.     Andrew Scriven who replaced the OLE functionality i needed with C
  338.     * got a bug fix off above to handle files with more blocks
  339.     * optional support for fontface if the text if an ascii based one,
  340.     i.e if were guaranteed that this is a western european language
  341.     then we do font faces, fastsaves will probably confuse this test and
  342.     mean we wont get faces even when we can handle them correctly.
  343.     * changed indent method for outline lists to multiple hard spaces, rather
  344.     than <dir>'s, in the future ill make an optional proper html conversion,
  345.     but it wont look like the original, so its a TO-DO.
  346.     * indentation of paragraphs dithered to <blockquote>'s is in, alpha support.
  347.     * absolute width and height of tables is in as well.
  348.     * i now default to outputting to a file whose name is the same as the input
  349.     file, with .html appended. graphics are output to the files with the same 
  350.     prefix as the .html file. use -o - to output to stdio
  351.     * new ole code was broken on a few files ( 1 :-) ), fixed this. 
  352. changes up to 0.4.4
  353.     * a good few bug reports in, crashes and what not, i got the use
  354.     of purify on a sun box (thanks to martin mellody et al) and sorted
  355.     out *all* the uninitilized mem reads there, (3000 of them in the course
  356.     of a typical conversion!!), it still leaks memory like a sieve but thats
  357.     not important for mswordview, though i will sort that out. purify is
  358.     a wonderful piece of work i have to say.
  359.     * changed ffffffff handling for lists, i think it means that
  360.     the list in question isnt actually there, so to skip it.
  361.     * changed blockquotes to dir, looks neater and word itself does
  362.     it, biggest software company in the world cant be wrong, can it ?
  363.     :-)
  364. changes up to 0.4.3
  365.     * oops, i shafted the inclusion of getopt for systems that need it.
  366. changes up to 0.4.2
  367.     * fixed broken simple mode footnotes (doh!)
  368.     * fixed bug in blip where having drawings where none
  369.     of them was a picture caused a crash
  370. changes up to 0.4.1
  371.     * did some tweaking to remove a crash.
  372. changes up to 0.4.0
  373.     * and big breaking news, preliminary graphic support is now in!!
  374.     yes, gifs/pngs/jpgs added to a document through the 
  375.     insert->picture->from file mechanism now convert correctly. They
  376.     are stored in the office draw format which ive just cracked the 
  377.     rough layout of. (through the handy ms spec on the msdn site),
  378.     graphic support is messy for now, as the files are generated in
  379.     the cwd of mswordview and named graphic*mswv.*, ill tidy it up
  380.     later, this news is too good to not get an announcement.
  381. changes up to 0.3.0
  382.     * added -m  --mainonly option if you dont want headers and footers.
  383.     * added a few more places to look for lls-mswordview
  384.     search order is now
  385.     1 in the path.
  386.     2 the same dir as lls was run from if ran absolutely.
  387.     3 the current dir.
  388.     4 a dir called laola off the absolute path.
  389.     5 a dir called laola off the current dir.
  390.     but stuff line ../../mswordview isnt in there though, coz folk should
  391.     just put lls-mswordview into their path dammit!
  392.     * diffent numbering formats for pagenumbering is in, a vs i vs 1 etc.
  393.     * gpprls for sep's work now, complex sections are in.
  394.     * found some strange code in clx_headers and clx_footers so i blew it 
  395.     away.
  396.     * section support in for simple saved files.
  397.     * sections that restart pagenumbering work now.
  398.     * sections that have no footers/headers at the beginning work now.
  399.     * complex support for sections is in as well, should work hopefully
  400.     needs extensive testing.
  401.     * TO-DO text color, eventually font faces, but no sleep lost on that i have
  402.     to say.
  403.     * TO-DO shaded cells in a table, think up a better table handling method.
  404.     * i now stick a space into an empty cell so that it shows up.
  405.     * another U8 wraparound bug removed.
  406.     * i now use the piecetable for simple docs, so as to skip over sections
  407.     that arent to be processed, i.e the simple format is just as complex as
  408.     the complex format :-), i think ive done this right and it wont break 
  409.     anything, ill have to wait and see though.
  410.     * changed slightly the portions of a field that dont get printed,
  411.     to make some html ones work, hope i havent shafted anything else.
  412.     * hmm, really need to cleanup character handling, unicode &
  413.     special reserved ms symbols and so on, im just plinking at
  414.     them for the moment.
  415.     * aghh, found another U8 overflow, what possessed me to put
  416.     them in in the first place ?, i should have guessed that
  417.     there would be hundreds of pieces in a file.
  418.     * received report that it compiles and runs with
  419.     Sparc solaris 2.5.1 - sparcworks compiler
  420.     &
  421.     Intel x86 solaris 2.5.1 - gcc compiler
  422.     * added patch from diakka <diakka@staff.sinanet.com> to run
  423.     create_bins on a make rather than make install
  424. changes up to 0.2.2
  425.     * compiled it on a solaris account i got, and its fine, got 
  426.     confirmation that it works from Will Renkel <renkel@cig.mot.com>
  427.     * changed fastsaved chpnextfc check to be >= rather that >, hope that i 
  428.     dont break anything cox of it.
  429.     * foolish error, U8 used for number of pieces, extended to U16
  430.     * changed embedded link handling to not end character properties in
  431.     the middle of a URL !
  432.     * changed embedded link handling so as to *not* place "" around urls,
  433.     as sometimes they are there already, and not having them doesnt hurt,
  434.     though it offends my sense as to how they should be done.
  435.     * would you *believe* these ms guys, now they are hitting me with
  436.     file offsets that are past the end of the file !!, so now i have to
  437.     watch out for that, the complex format is *such* a collection of
  438.     hacks, ah-ha ive just checked in word, this file crashes word :-)
  439.     so this is the first reported case of mswordview being better than 
  440.     msword, though i have to say that in recovery mode word pulled loads
  441.     of text out of it that i didnt get, :-(, still its a corrupt file
  442.     so doing anything at all is a success.
  443.     * i forgot to reset the higher list levels when changing a lower one,
  444.     fixed now, i think ive it right.
  445.     * added a define of SA_RESTART to 0 if it isnt there. bash does it so
  446.     i should get away with it, sunos seems to need it.
  447.     * added a little patch from Zachariah Baum <zack@studioarchetype.com>,
  448.     that should help get around folk who run mswordview absolutely and dont 
  449.     stick lls-mswordview in their path, ie make and then dont make install.
  450.     * fixed yet more bugs, for some reason i thought that
  451.     the order of evaluation was from right to left !!!!
  452.     i.e i was doing 
  453.         if ((*p == 'a') && (p!=NULL))
  454.     doh!
  455.     * changed web interface so that utf-8 is always on.
  456.     * font characteristics turn off when going into tables now.
  457.     and turn back on when inside, gets rid of some off look
  458.     and feel.
  459.     * checked out corel's wordperfect import functionality with
  460.     office 97 files, conversion isnt as good as mswordview i think.
  461.     missing header numbers, and one or two didnt convert at all.
  462.     though of course corel retains layout which mswordview cant
  463.     do with html, and does shading, ill check pictures at some stage.
  464.     * have a report that suns pcfileviewer similarly covers about 50%
  465.     of mswordview's functionality and vice versa.
  466.     * gzipped uploaded word file collection has just hit 120megs :-)
  467.     * i now look at this section table so i know whether its a section
  468.     break or page break. If its a section break, then the header/footers
  469.     revert to the beginning again.
  470.     TO-DO, add an space to empty cells to make them look reasonable in 
  471.     netscape.
  472.     TO-DO check page numbering with sections.
  473.     TO-DO, do endnotes, should be easy. make new pic to replace hr
  474.     lines, theres too many hrs now at the bottom of a page to make
  475.     sense to anyone anymore. if theres no footers, then dont do
  476.     the lines.
  477.     TO-DO, continue with the sent files since 0.1.0, and the rest
  478.     of them.
  479. changes up to 0.2.1
  480.     * removed bug that caused lists to drift further and further
  481.     right.
  482.     1. checked out the blockquote indention for lists, doesnt
  483.     appear to be right for srom*.doc, fixed now
  484.     took closer look at font scanning in decode_letter,
  485.     in particular special chars, the < 39 wasnt precise enough, being
  486.     in a wingding/symbol font seems to make you automatically a special
  487.     char.
  488.     2. something not fully right with lists that take their
  489.     text as special chars (i.e sectionnumber), not done by ms in
  490.     an obvious fashion. edit doc down to just the 2 headers and then
  491.     see what happens.
  492.     3 AHA!!!, 1 and 2 are wrong, as was previous ideas to ignore lists
  493.     that appear to have nothing in them, they are there to artifically
  494.     bump lists up to a different starting number without requiring a
  495.     seperate list definition for each one, ms shoves in dummy elements
  496.     to get the list up to the right number, the section id just before
  497.     one of them threw me entirely, i thought the section number should
  498.     have been the text of the list. ive got it now!
  499.     * 3 above is *rubbish*, thats not it at all, i was right originally,
  500.     ignore those 0 len lists, and the problem was with my list restarting
  501.     mechanism which didnt work if there was more that 1 list between list
  502.     section that had to continue numbering.
  503.     * numerical outline list sublevels will retain the prefix of the 
  504.     above levels, this required a change of the number figuring out code,
  505.     its now rather heavy of silliness, but it works, i dont love it and
  506.     im sure lists will be back to get me again at some stage, but outline
  507.     lists now work, in particular the 
  508.     1
  509.     1.1
  510.     1.1.1
  511.     style.
  512.     * TO-DO sections, srom*.doc has them, check them out.
  513.     * TO-DO change web interface so that the utf-8 can kick in if 
  514.     needs be.
  515.     * fixed bug where the new piecetable check in simple saved
  516.     files fell apart after hitting a footer.
  517.     (tempcp = tempcp, rather than realcp=tempcp, doh!)
  518. changes up to 0.2.0
  519.     * well arse again, ive revised my ideas as to what consititutes
  520.     the end of a piece, rather than the beginning the the next piece as
  521.     i was doing, i now believe thats its the beginning of the piece +
  522.     the twiddled cp len. makes more sense, and removes crashes from the
  523.     latest doc i was given.
  524.     * distinguishs between odd & even page footers.
  525.     * TO-DO odd & even headers
  526.     * added the tm symbol as a special case, theres quite a large
  527.     range of unicode that ms is using that is part of the customizable
  528.     section, i.e theres loads of glyphs that ms can use that are not
  529.     part of the standard unicode set, the tm appears to be one of hundreds.
  530.     eventuallly ill have to get a table of them.
  531.     * woweee, is ms an evil designer of data formats, they have two
  532.     types of simple saved docs i thought, those in 8 bit (basically ascii) 
  533.     and those in 16bit (unicode), hah bloody hah, ive been given one which is a 
  534.     mixture of both, and i have to use the damn piecetable to shove it together.
  535.     and its not as if the document shifted into a different language of 
  536.     anything. if this was fastsaved id not blink an eye, but simple saved, 
  537.     come *on*, why bother calling it simple saved. so i have to keep an eye 
  538.     on the piecetable to determine what exact offset to use after all.
  539.     * added a huge bit filthy hack in for more list twiddlings, the 
  540.     previously mentioned unknown 4 byte sequence now rears its head
  541.     as an optional 8 byte sequence !!, but always ffffffff, it might
  542.     be some kind of flag or summat. anyhow i now chew up any 4 bytes
  543.     consisting of this if they show up in the place that they might
  544.     appear, this removes a large crash that occurs otherewise, as all
  545.     the counters get thrown off course by them.
  546. changes up to 0.1.1
  547.     * added Makefile patch from Pavel.Roskin@ecsoft.co.uk (says it works
  548.     on hpux)
  549.     * well the good news is that the unicode utf-8 is working for
  550.     taiwanese and im sure other languages, the bad news is that everyones
  551.     telling me that noone in their language group is actually using unicode :-)
  552.     so i suppose i require a huge unicode --> JIS/EUC/KSC/Big5/GB converter.
  553.     :-)
  554.     * rudimentary support for annotations, i havent too many examples of these 
  555.       but i think they'll work fairly well.
  556.     * rudimentary support for all special ascii codes for time,page no etc.
  557.     p.s by rudimentary support i mean that if asked for e.g the current date
  558.     in a particular format i output the date, maybe in the correct format
  559.     maybe not. i.e the meaning is the same, though the look might be different.
  560.     * added a supported sprm, that changes chp information totally to the
  561.     chp of a different style.
  562.     * added support for custom footnotes, had to do a bit of a hack to
  563.     get the <a name> stuff right, hopefully it'll always work, even if it
  564.     doesn't itll still be readable.
  565.     * twiddled the char formatting dependancies about again, really ill have
  566.     to redesign that a bit.
  567.     * broke the mswordview.c file down a bit into other files. 
  568. changes up to 0.1.0
  569.     * hell ive enough done to warrent a new numbering system.
  570.     so from now on
  571.     x.y.z
  572.     x is a stable bug free (hah) release. folk packaging for commercial
  573.     unices probably should wait for these releases (none yet, i know)
  574.     y is a new feature or enough bugs fixed that you better use this
  575.     version if you want to keep up with the jones. 
  576.     z is some small bug or change that is small enough that i wont upload
  577.     it to sunsite et al automatically, itll be mostly for me.
  578.     * added a defaultfont size option, so that if you think the output is
  579.     too big or small, you can skrink or enlarge it.
  580.     * added a horizontal padding option, you have the option of 3 different
  581.     ways to handle a run of multiple line breaks, though the default is probably 
  582.     the best.
  583.     * tweaked char formatting system, TO-DO overhaul all of that, theres quite
  584.     a few dependancies between the tags thats becoming a little to difficult
  585.     to do by hand, a little stack is called for methinks.
  586.     * added some support for a type of holdover list format found in docs
  587.     converted to word8 from older versions. works on the one i have so far
  588.     though theres more testing to be done with it. missing bullets and 
  589.     incorrect numbering may be related to this. pass them on to me.
  590.     * battered LFO's into submission, this time they'll stay down (i hope).
  591.     found a 4 byte field that i cant figure out where it came from. *shrug*
  592.     wouldnt be the first time that happened though.
  593.     * changed footer and header handling, i now take notice if the first pages
  594.     headers and footers are different that all the others. i still dont get
  595.     section breaks, which i think impact on this, i dont have any examples of
  596.     this to work against. Theres a discrepency between header/footer documentation
  597.     and what i see before me in the hex, maybe im missing something.
  598.     * ok theres some difficulty with tables, ive implemented this baby as a
  599.     one pass parser, later ill have to add multipass (or backpatch) to figure out 
  600.     the number of pages so as to get that field right, but with ms tables you can 
  601.     start off with 2 cols then go to e.g 4 in the same table, you dont know in 
  602.     advance how many rows and cols there are in maxiumum, or which ones span which,
  603.     which is a pain in the butt, really as far as word is concerned each row 
  604.     is a table into itself, so ive done it this way
  605.  
  606.     - each table has the cols of the first row counted and the widths
  607.       figured out in % of the page width, if a subsequent row has a different
  608.       number of rows or different widths than the previous row a new table 
  609.       will be begun. the % width will cause netscape to line them up correctly.
  610.       itll do for now. not perfect i know but hey what is. Itll do the job
  611.       for the primary task which is making word readable as close to the 
  612.       original layout as possible within html. 
  613.     - to get the tap that tells me all the above we have to scan forward
  614.       until we find a rowend char, and get the pap of that to get the tap.
  615.       and with fastsaved theres the usual complexity
  616.     - The problem will be that netscape and other browsers dont take the 
  617.       width% as their primary factor in determing the actual width of a cell, 
  618.       if the text in it cannot be broken on a space then the cell is expanded 
  619.       to fit, breaking the lineing up. Im considering a somewhat more sophisticated
  620.       (and questionable) technique where i stick the tables together using
  621.       dithering of the cells to a (max 64 cell (msdefined)) cell grid. using colspan
  622.       and so on to do it.
  623.     * TO-DO theres something called a header text box that i have to figure out
  624.       and some companion of it for the main doc. i have to implement something to
  625.       handle these beasts.
  626.     * TO-DO more testing for bugs and stuff.
  627.     * TO-DO code overhaul to simplify it.
  628.     * TO-DO support all fields, ive some supporte page no, date and time.
  629.     but not perfectly in the same format that word has them in.
  630.     * TO-DO,figure out how to extract ole embedded msoffice draw and equation
  631.     editors data, and see if i can get them converted as well.
  632.     * TO-DO provide alternative outputs, tex/rtf and friends. ive a load of
  633.     formatting information that i think i can get into those formats.
  634.     * TO-DO provide basic formatting for html, i.e centering.
  635.     * TO-DO think about writing word docs :-), now that would be a hunk of work.
  636.     so to all you asking me about it i recommend you dont even bother with it,
  637.     just write rtf files and get on with it, thats even what ms did for word 8,
  638.     saving as word 6/95 just creates a rtf file, if its good enough for them, its 
  639.     good enough for us.
  640.     * TO-THINK-ABOUT i dont keep very much information in memory really, i just work
  641.     out what i need for any given instant and drag it out of the file, and then dump it
  642.     often to only get it again in a few seconds. this leads to an impressive amounting
  643.     of seeking back and forth across the streams. theres a groove burnt in my hd where
  644.     im working, its not really optimum behaviour, (works though :-) )
  645.     * NEED_HELP-ON, can this compile and work under sgi ?, have success reports
  646.     from linux, solaris,hpux,aix,freebsd and one failure to compile under sgi, ive
  647.     one message that it compiles under os/2, though it needs some work to do that.
  648. changes up to 0.0.27
  649.     * know how to do the right thing with embedded sprm list
  650.     gets rid of a few wild bugs.
  651.     * found the list documentation after all, maybe i forgot
  652.     to download it the last time (doh!), or it wasnt there
  653.     when i downloaded it. so i removed all of my rather good
  654.     but unnecessary hex determined code.
  655.     * added a special case for "*" in lists, make it a bullet
  656.     point instead, seems to be the right thing to do (?)
  657.     * changed laola commands name to append -mswordview to avoid
  658.     overwriting newer lls commands etc.
  659.     * changed the INC in perl files to reflect final install dir.
  660.     * TO-WORRY-ABOUT, quite a few ??'s displayed in netscape when
  661.     dealing with those utf-8 docs, dont know if thats my lack of
  662.     correct fonts, or a great big dirty bug. also ive a few special
  663.     cases in the decode_letter to translate letters into what *i* think
  664.     they should be, its rather questionable and very emperically based.
  665.     * added some hook code to protect lists from pagebreaks. 
  666.     in doing so i notice that my complex code is a wee bit confused, but
  667.     it works, so im leaving it alone for now, the added code doesnt make
  668.     for reability but hey, neither does any of the rest of the code :-)
  669.     * fiddled list interpertation so that ilfo isnt looked at until the
  670.     last pap and chp sprms have changed it. fixes difficulties in fast
  671.     saved files.
  672.     * TO-DO
  673.     (list stuff) LFO override not implemented correctly may cause crashes.
  674.     this is surely the last major list related thing to do.
  675.     restarts are probably incorrect as are a few other minor list 
  676.     related bits and pieces
  677. changes up to 0.0.26
  678.     * changed laola lib to a subdir of mswordview and changed laola
  679.     program names to custom mswordview ones, to avoid clashing
  680.     with newer versions or original version of laola, as ive
  681.     doctored things slightly for my own needs.
  682.     * applied Martin Schultze patch to add lib path to perl include
  683.     path, though i twiddled it to make a nice tree in my lib.
  684.     * lists start on the correct number (well ones that are simple
  685.     numerals do anyway).
  686.     * understand list continuing and restarting now.
  687.     * added a defensive patch from Peter Silva <Peter.Silva@ec.gc.ca>
  688.     * lists now get the char formatting that they should get.
  689.     * yes!, sorted lists out, have bulleted lists, arabic & roman numerals,
  690.     lowercase and uppercase lettering systems done. multilevel also works
  691.     i believe, works on all examples i have anyway
  692.     * fixed bug that made mswordview fail on files without an extension
  693.     * TO-DO look at list indentation, if they are true multilevel then
  694.     i blockquote them (for now), but if they have a set indentation value
  695.     then like all the other layout constructs i dont preserve this into 
  696.     html.
  697.     * TO-DO fields, table of contents should be easier with lists
  698.     done.
  699.     * TO-DO find out if my unicode (utf-8) support actually works
  700.     for anyone except me. What fonts do various people need, this
  701.     is a general netscape question.
  702.     * middleterm TO-DO, reorganize tags to external data files, to make extensible
  703.     to other formats, i.e raw ascii, an attempt at latex, rtf. 
  704. changes up to 0.0.25
  705.     * changed list handling slightly, removes a bug where
  706.     you get too many list levels inserted
  707.     * i believe that most lists will now be handled correctly as to
  708.     whether they are numbers or not. I have isolated the undocumented
  709.     section and have a handle on the situation so its just a matter
  710.     to comparing theory with practice again.
  711.     * removed bug where header pap gets used in the main document
  712.     following a header
  713.     * finished checking all uploaded files beginning with a, yipee.
  714.     now theres quite a few elements not addressed yet in those files, but 
  715.     i understand whats involved, in short, section support, proper list 
  716.     support, justification support (centering anyway) decoding of the DATE 
  717.     and TIME fields, would you believe that the TIME field can encode the 
  718.     DATE, despite the fact that theres a DATE field whos job this is !, 
  719.     gagh what can you do with people who do this to you. but anyhow the 
  720.     uploaded all convert without crash, all text is in the right place, and
  721.     in the right language ( i think :-) ).  all bold,italic,font sizes,
  722.     underline, manual page breaks, the content of footnotes,footers 
  723.     and headers is all shown, albeit not always the way they appear in 
  724.     word, yeah we're getting there.
  725.     * changed utf conversion code as the original code i was using wasnt
  726.     quite gpl compatable, anyhow new code is better designed for my needs.
  727.     * TO-DO, grr!! is someone reading this log, as after my weeks holidays
  728.     i note thats theres a huge amout of files beginning with a to go through
  729.     again, i never did make it to b.
  730. changes up to 0.0.24
  731.     * fixed NULL complex pap bug.
  732.     * supports underline tag now as well :-)
  733.     * footnotes supported, all the ones referenced before a 
  734.     pagebreak get listed at the manual pagebreaks and document
  735.     end . (thats a <hr> in my current output, splitting word docs
  736.     into different files is a challenge id rather not accept for 
  737.     now as itd just be guesswork and mess), not checked in fastsave
  738.     yet though.
  739.     * TO-DO support sections, so as to know what pages get headers
  740.     and which dont, etc.
  741.     * TO-DO proper table of contents, the text is now listed
  742.     but theres no link between the table of contents and the
  743.     text it purports to describe, for the moment.
  744.     * TO-DO differenciate between different types of underline
  745.     i.e word for word etc
  746.     * EVENTUALLY-TO-DO, i have come across one case where a symbol 
  747.     used in a footnote isnt working !, if i create one of my own
  748.     it works fine, but when i alter the given one it still 
  749.     occurs, strange.
  750. changes up to 0.0.23
  751.     * verified it works on linux, aix and solaris.
  752.     * fixed a very silly overflow byte vs int bug. 
  753.     * overhauled unicode conversion, fixed my sprm
  754.     size detection.
  755.     * changed table handling so that tables dont
  756.     end prematurely.
  757.     * fixed img insertion dummying of wingding font 
  758.     support.
  759.     * massively changed my paragraph end detection for
  760.     complex files, i had the idea all wrong, but close
  761.     enough that it worked on fairly uniformly formatted
  762.     files.
  763.     * works with all uploaded files beginning with A and a
  764.     theres soooo many to go through :-), im looking
  765.     forward to getting to b soon.
  766.     * TO-DO, continue checking against uploaded files,
  767.     verify header and footer support, start on list
  768.     information (dum de dum dum dummmm)
  769. changes up to 0.0.22
  770.     * check for errno
  771.     * fix list related crash bug, found by Wayne Roberts 
  772.     <milcom@netcom.com>
  773.     * TO-DO, go through the 50 megs of uploaded word
  774.     files and see do the convert fairly correctly :-)
  775.     lists need to be done better. i need to confirm
  776.     language conversion. and check out table of
  777.     contents field.
  778. changes up to 0.0.21
  779.     * for simple format i now decode to utf-8, when appropiate.
  780.     on viewing many docs with windows netscape 4 it works
  781.     fine, i dont have the X fonts to do half of the
  782.     languages under my own X, but hopefully those
  783.     in the various language blocks can figure out
  784.     fonts for themselves ?
  785.     * complex format non-west-european docs might
  786.     still be shagged, id love to hear from an asian
  787.     language group as to whether or not the utf8 works
  788.     for them
  789.     * some bug fixes by Pavel Machek <pavel@Elf.ucw.cz>
  790. changes up to 0.0.20
  791.     * headers are fairly correct now, the spec and me 
  792.     are confused as to headers and footers though, so 
  793.     while i *can* do headers and footers, it might require
  794.     a bit of fine tuning, so i need docs with all sorts
  795.     of header and footer types in them until im sure im right
  796.     , but its close enough.
  797.     * docs with subdocs in them should return the output of
  798.     the main doc now.
  799.     *to do, from the veritable deluge of documents in languages
  800.     i cant read :-), id better handle the non-standard, well
  801.     non standard to me anyway ! russian and one or two
  802.     others that i hope fall out in the process, asian
  803.     would be wonderful.
  804. changes up to 0.0.19
  805.     * header support added to complex format
  806.     * wingding font hack added like symbol font
  807.     * headers are still not right, footers and headers are all 
  808.     appearing at the top of the document, ive more work to do on
  809.     that next.
  810.     * ive shagged up the parsing of lls output, so docs with
  811.     ole inside ole will not work even though theres no good reason
  812.     they dont, bear with me on this
  813.     * mswordview.wrapper added to allow inline viewing of word docs.
  814. changes up to 0.0.18
  815.     * new option to not change msword headings to html headings to 
  816.     support those dodgy people who dont use them correctly.
  817.     * fixed what looks like a specialized case for recognizing tables
  818.     * fixed the lack of - sign.
  819.     * have a new group of files that convert correctly.
  820.     * these are minor changes, ill add header handling to complex
  821.     format tomorrow
  822. changes up to 0.0.17
  823.     * lack of getopt.h on some systems taken into account now.
  824.     * sub and super scripting now in for simple format.
  825.     * laola.pl changed to continue even if it thinks the file is
  826.     the wrong length.
  827.     * added option to not attempt to dummy up formatting done with
  828.     whitespace.
  829.     * using gifs for symbols, this will do for html output, for
  830.     other output in the future we'll have to organize something a 
  831.     little more sohpisticated
  832.     * i have some alpha support for headers in at the moment, 
  833.     if you have headers you "might" see them in russet text.
  834.